جانشینی مقادیر مفقود و تأثیر آن بر دقت کلاسه بندی در داده کاوی پزشکی

نویسندگان

حمیدرضا طهماسبی

hamidreza tahmasbi 1. m.sc. of computer engineering , lecturer of computer engineering dept., islamic azad university kashmar branch, kashmar, iran.1. کارشناسی ارشد مهندسی کامپیوتر، مربی، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد کاشمر، کاشمر، ایران. ملیحه آموزگار

malihe amoozgar kashmar branch, islamic azad universityکاشمر-دانشگاه آزاد اسلامی هادی آدینه

hadi adine kashmar branch, islamic azad universityکاشمر-دانشگاه آزاد اسلامی

چکیده

مقدمه: وجود مقادیر مفقود در داده های پزشکی می تواند تمام فرآیند داده کاوی و تفسیرهای حاصل را تحت تأثیر قرار دهد. بنابراین برخورد با این مقادیر ضروری می باشد. در این پژوهش تأثیر روش های مختلف برخورد با مقادیر مفقود بر روی دقت کلاسه بندی داده های پزشکی مورد ارزیابی قرار گرفت.  روش: در این مطالعه، تأثیر روش های معروف جانشینی مقادیر مفقود شامل mean/mode، hot deck، k-nearest neighbor، maximum possible value، all possible value، case deletion و regression بر روی دقت کلاسه بندی مجموعه داده های پزشکی سرطان سینه، ناراحتی قلبی، بیماری های پوستی، هپاتیت، تیروئید، دیابت، تومور اولیه، بیماران کبدی، سرطان ریه و بعد از جراحی، به ازای شش نرخ مختلف مقادیر مفقود، ارزیابی شد. در آزمایش ها از دو کلاسه بند شبکه های عصبی و نزدیکترین k همسایه در نرم افزار داده کاوی weka استفاده شد. برای تخمین دقت، از روش 10-fold cross validation استفاده شد. نتایج: نتایج نشان داد برای کلاسه بند شبکه های عصبی، همه روش های جانشینی در برابر نرخ های مختلف مقادیر مفقود، تأثیرات متفاوتی در دقت کلاسه بندی داشتند. برای کلاسه بند نزدیکترین k همسایه، روش جانشینی mean/mode در مقایسه با سایر روش ها تقریباً با افزایش نرخ مقادیر مفقود، باعث افزایش دقت کلاسه بندی گردید. در مجموع، هیچ یک از روش های جانشینی به ازای همه نرخ-های مختلف مقادیر مفقود، همواره بیشترین دقت را نتیجه نداده و برتری نداشت. نتیجه گیری: تحلیل نتایج نشان می دهد روش های جانشینی بررسی شده به ازای همه نرخ های مختلف از مقادیر مفقود شده لزوماً باعث بهبود دقت کلاسه بندی نگردیده و هیچ کدام از روش های جانشینی بررسی شده بهترین روش نیستند.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

داده کاوی و کاربرد آن در تصمیم‌گیری‌ها

ابهامات محیطی ناشی از مدل‌های نوین کسب و کار سبب تشدید پیچیدگی در تصمیم‌گیری، به‌ویژه در حوزه کسب و کار شده است. به‌طوری‌که بسیاری از متغیر‌های تاثیرگذار ناشناخته بوده و روابط میان آن‌ها نیز غیرخطی و پیچیده است. در چنین شرایطی دیگر نمی‌توان داده‌ها را با ابزارهای سنتی تحلیل نموده و از آن‌ها دانش استخراج کرد. از این روی مقاله حاضر به تشریح تکنولوژی داده کاوی در حوزه هوش محاسباتی و متدولوژی استا...

متن کامل

بررسی میزان تأثیر داروهای درمان ناباروری در بیماران نابارور با استفاده از الگوریتم خوشه بندی و تکنیک های داده کاوی

Background and purpose: The rate of infertility has increased throughout the world. Data mining is a new method for analyzing information from databases. Few studies are done regarding infertility and using data mining in describing and predicting different treatment methods and factors influencing these methods. This paper proposes a model for evaluating the efficacy of different drugs in trea...

متن کامل

طبقه بندی متقاضیان تسهیلات اعتباری بانکی با استفاده از داده کاوی و منطق فازی

در این پژوهش، هدف، بهره گیری از ابزارهای داده کاوی و منطق فازی برایطبقه بندی مشتریان تسهیلات اعتباری می باشد به طوریکه ابهامات و عدم قطعیت رادر خصوص طبقات مشتریان و نیز متغیرهای تاثیر گذار در رفتار آنها را پوشش دهد.روش کار بدین شکل می باشد که طبق یک فرایند استاندارد داده کاوی، داده هایمشتریان سابق بانک سامان جمع آوری و پالایش شده و سپس طبقات و متغیرهاییکه قابلیت فازی کردن داشتند، طبق نظر کارشنا...

متن کامل

کاوش پویایی مشتری در طراحی بخش بندی با استفاده از روش های داده کاوی

یکی از موضوعات مهم در مسئلۀ بخش­بندی پویای مشتریان، انتقال مشتریان به بخش­های مختلف در طول زمان و کشف الگوهای حاکم بر این جابه­جایی­ها است. بر این اساس، این مقاله بر پویایی مشتری تمرکز کرده و تلاش می‎کند، گروه­های رفتاری مشتریان و ویژگی­های غالب این گروه­ها و الگوهای کلی حاکم بر جابه­جایی و مهاجرت مشتریان به بخش­های مختلف را در طول زمان استخراج کند. برای این کار، روش ترکیبی جدیدی مبتنی بر الگور...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
مجله انفورماتیک سلامت و زیست پزشکی

جلد ۲، شماره ۱، صفحات ۲۴-۳۲

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023